8月10日,2023 中关村论坛系列活动——2023 科学智能峰会(AI for Science Congress)开幕。2023 科学智能峰会(下称“峰会”)由中关村论坛办公室作为指导单位,由北京科学智能研究院主办,北京大学北京国际数学研究中心、北京大学国际机器学习研究中心、北京材料基因工程高精尖创新中心、DeepModeling 开源社区、嘉庚创新实验室人工智能应用电化学联合实验室(AI4EC Lab)、宁波东方理工大学(暂名)、上海交通大学药学院、深势科技、苏州实验室、之江实验室、中国科学院计算机网络信息中心、中国科学院宁波材料所联合承办(按拼音首字母排序),由新华网作为战略合作媒体,旨在搭建 AI for Science 领域科研突破、技术培育、人才交流的共建共创平台,共同推动 AI for Science 的基础设施建设,激发创新效能。
2023科学智能峰会,以“四梁N柱“为主线展开,设置了10余场深度研讨的学术分论坛。AI for Science 是一个具有广阔前景和巨大潜力的领域,也是一个充满挑战和机遇的领域。希望本次会议能够为参会者提供一个高水平的学术交流平台,激发 AI for Science 领域的思想碰撞和智慧交流。
本次峰会采取开放讨论,共商共创的交流模式。主论坛上,主办方北京科学智能研究院院长鄂维南院士进行了题为“共建AI for Science”的“引导性”发言。开幕式上,还设置了两场“巅峰对话”,主题分别为“大模型与AI for Science”,“AI赋能不同研发领域的同与不同”。
今天与大家分享巅峰对话二的完整实录:
朱维良:中国科学院上海药物研究所研究员,药物发现与设计中心主任孙伟杰:深势科技创始人兼首席执行官
孙伟杰:各位领导,各位老师,各位同学:大家下午好!刚才在听上一个报告的时候其实也一直在思考我们本个panel的问题,很难比上一个panel更加精彩,也是期待各位老师在这个环节里能更多的碰撞。 经常会跟大家讨论我们做算法顶天还是立地的问题,其实顶天和立地本身就像一块磁铁的两个磁极一样无法分开的,刚才我们把更多的顶天的,尤其是领域前沿概念的发展已经讨论过了,接下来立地的问题,落地场景的问题就交给咱们的这个环节。 因为药物研发和电池这两个领域是AI for Science相对来说进展比较快的领域,所以我们今天也是特意邀请了来自生物医药和电池研发的四位专家,每个领域都是有一位学术界和一位工业界的,通过比较的视角讨论我们从创新到落地,以及行业实践这样的问题。 可能就不让每位老师单独做自我介绍了,我就直接从针对每位老师的问题开始。最先可能先提问张强老师一个问题,因为张强老师在电池的计算和AI这一块研发研究的经历是非常非常丰富的,想请您分享一下您过去在能源、电池、材料化工等领域的研发里面,AI给您带来最大的最兴奋的进展和成果大概是什么,跟大家分享一下。张强:我们做电池研究、做能源存储确实赶上一个很好的历史机遇,这个历史机遇是咱们所有的人都不满足于当前的手机、笔记本里面的锂钴氧对碳这样一个体系,而需要更安全、更高能量密度、更长循环的体系,所以大家可以看到近10年以来对于电池材料的研究,咱们中国的科学家做出了很大的贡献。 实际的一个电池体系里面不仅仅有正极材料、负极材料,还需要正极和负极对话的电解液,电解液实际上是沟通正负极的桥梁,经过从最早50年前在当时任职于Exxon Mobile的M. S. Whittingham最早提出锂电池体系,直到现在做了上万种,找了十几种好的配方,所以也使我们充分感觉到做好一个电化学体系有这样一个好的环境是特别特别重要,但是环境的摸索还是非常困难的,因为大家知道这种小分子构成的有机融机的种类,就以一个13个碳氢氧氮氟这么一组合10的6次方这样一种可能性,所以这样的话我们就很难在实验研究中去便利,去来寻找哪一个体系能够和我们的电极材料做很好的匹配,所以我也特别幸运,我们清华有一位博士是陈翔,本科是数学和化工的双学位,数学也拿过全美竞赛亚太地区唯一一个特等奖,他就非常感兴趣能不能用计算机的方法来快速的筛选,我觉得这也是使我们当时能够感觉到眼前一亮一个新的维度,这个维度不像在实验室通过炒菜trial and error的方式去一个配方一个配方、大概花半年左右时间去尝试,而是要用化学的语言,要用量子化学、分子动力学能够把我们电解液核心的属性通过计算机去来进行大量的筛选,我们通过这样一个属性的类比来去找到是不是有这样的一个新体系,所以我们最近在做像锂硫电池,包括做固态电池找一些化生剂的时候,实际上就会发现利用AI测算的一些新分子的路径和我们当前使用特别好的几个分子路径还是有很多类似的区域。 除了有类似组成以外,我们发现有些体系原来从来没有被考虑用过的溶剂,但是它仍然能够表现出很好的稳定性,和我们正负极有很好的匹配性的电子结构以及锂离子在这个体系中有很好的粘度、迁移数属性,目前我们正在从AI计算出的20多万分子中,有选择性的从几十个里再去找几个好用的。这样就相当于原来咱们在太平洋中只发现了夏威夷岛,我们最近又找到了像塞班岛又找到了像新西兰岛等新的领地,而且我们通过初步的尝试发现有些岛屿提供的分子属性确实很管用,这也是通过大规模大数据计算,尤其是我们最近在琢磨是不是能够通过AI来进一步显著的缩小计算量,能够使我们这样一个获得结论的速度更快,所以我觉得非常激动的是,通过计算机不用实验,但是用这样的化学模型和当前的计算,尤其是AI辅助,通过AI来加速计算,确实有效加速了我们从海量分子中找到有用的小分子,所以我觉得这也是一个特别激动的,也是特别欢迎更多同行能够加入到这个领域,使我们有好的电解液,使我们的电正负极材料能更好的存储能源。这也是我想AI技术带给我们能够去找到原有知识边界以外的新体系,能够加速我们寻找非常令人激动的这样一个故事。孙伟杰:感谢张强老师的分享。我追问一个问题,咱们这么好的这样一套方法如何更快更好让更多下游学术界和工业界的客户都使用并且参与进来呢?张强:您这个问题非常好,我们目前正在把这样一个数据库平台通过组装,未来看看是不是能够结合具体体系做适当的开放,能够使验证工作和我们AI的测算工作能更好的结合。因为我想只有不断打破边界走在前面,才能保持我们创新动力来源,使我们创新的技术变成科技生产力,所以还是想把这样一个平台基础能更多的和我们各位同行来合作。孙伟杰:好的,感谢您。正好宁德时代的赵旭山今天也是我们panel的嘉宾,我问赵旭山老师两个问题,一个是像学术界这些非常前沿的技术突破通常在企业里面是怎么看待和使用的?第二,其实宁德时代内部有非常非常多的对于这些AI计算化学方法的应用,听说也是解决过非常非常关键的比如说一些专利这些方面的研发和突破、技术路线选择的问题,也想听听赵旭山老师在方便分享的范围内有哪些好的研发实践,可以给大家讲一讲。赵旭山:行。我想我倒着回答你这两个问题,我先回答你第二个问题,我们有哪些成功的实践。这个我就从我个人经历来说吧,我先从对我观念转变比较大的一两个案例来讲,因为我之前是在中科院计算机网络信息中心,今天我们的领导也在做,包括带我进入材料基因工程的苏老师也在做。就是说之前大量在做材料基因或者说大量的在做AI数据驱动的这些方法,但是从我的认知当中其实我对自己有不自信的一些成分,因为我觉得在我之前的研究经历中,包括多尺度计算也好,AI也好,更多的像是一个花瓶,就像刚才王坚院士也提到过一些偶然性的东西,它在发现一个新东西或者发现一个亮点工作的时候很偶然,不是一个成系统或者成体系的东西,所以到宁德时代以后,其实当时我们高层欧阳总裁也对这个方向有很多的期望,希望能做出来一些创新性的工作、颠覆性的工作。但是整整一年时间,其实我是没有信心的,我下边从无到有,最开始一个人,一年之后发展到十几个人的团队,其实当时我是没有信心的。但是一件事儿很大的改变了我的看法,这也可以作为一个具体案例跟大家分享一下。就是在一个非传统电池里边添加剂的筛选,最开始在做这件事儿的时候,我跟我们的实验团队说,你们的筛选维度是不清晰的,这是第一个。第二,这些筛选维度的多尺度计算方法是没有建立起来的,这个是很难筛的。 但是我们计算团队给我的回复是什么呢?或者你拍脑袋,或者我拍脑袋,你拍脑袋总比我拍脑袋强,你拍脑袋总有一套系统的方法在里面,我拍脑袋就纯拍脑袋。我们当时在一个很少筛选维度的情况下做了这一项工作,最开始也就是说从一些可以公开这样数据库当中,大概那个数据库里边有50多万个添加剂分子,因为业内已经验证过有些添加剂是好的了,我们当时也没有别的方法,就用结构相似性它含有哪些官能团片段,带有哪些特征的集团,用结构性的筛选相似度的方法给它缩减到1万多种,这1万多种其实往下就是用一个主动学习加上高通量的方法来建立它这个预测模型,算一部分预测一部分,这样迭代几轮以后最终筛选出来的当时是8个分子,这8个分子实验团队拿去验证了3个,在同等条件下这三个分子都比他们现有的分子性能要好,这其实对我是极大的冲击,极大的关键转变。就在我进宁德时代一年之后我第一次突然感觉到高通量计算、多尺度计算、AI for Science,当时还不叫AI for Science,我们内部叫AI+物理,其实就是一个数据驱动的方法,它会这么有用,这是第一件给我信心的事儿。 我再分享一件事,在电池领域只是材料的设计筛选,还有我们对于电池这样的一些预测,还有预警。因为电池嘛它就是充放电一次这叫一圈,我们所有的电池,包括手机电池,包括动力汽车电池都是有寿命的,它能循环3000圈,像磷酸铁锂3000多圈,像氧化物三元的电池大概现在2000圈左右的时间。那我们就需要在它出厂的时候对它寿命做一个评估,根据它初始的80圈、100圈的循环数据去预测它的寿命大概是什么样的,为什么要做这个预测呢?因为我不可能在实验室挂测,我把整个实验室电池挂测完需要两三年的时间,这是一个。 第二个就是说找出来一些这样的异常信号,对安全做一个预警。最开始我进宁德时代,我带了一个AI团队,老板自然而然认为你做AI,你就应该做这件事儿。我当时想这跟我有屁关系,我是做材料模拟,你给我一个实际数据预测方法跟材料模拟没关系,因为我是这样的观念,其实一年半时间我根本没做出来成果。但是我跟领导汇报的时候,领导会告诉我这件事儿你不能停,不管怎么抵触你要把它顺下去,到年底的时候我接着回答你第二个问题,就是跟老师们科研成果的结合,到年底的时候,我当时听了一个,我们业界挺知名AI老师的一个报告,他中间有一页,他利用开源这样的电池数据做出来一个很好的预测模型,这突然让我产生了一个很好的想法,因为我们实际工厂里边的测试数据,包括车厂拿过来的数据质量是很差的,我们做模型是很难的,能不能先用这些开源数据,这些质量比较好的数据线做一个模型再用我们实际数据驱做这个修正呢?这个想法产生以后,三个月之后我们做出来了这样一个模型,其实在你们看来都是很简单的一个模型,就LSTM加上一些平滑,加上一些这样的模型,但是它的预测效果当时公司内对我的评价是比其他部门,比专业做这些的人都要好,所以第二个问题就是说我们要去理解,要去观察像张强老师,像我们业界许多顶级专家做的一些工作,我们自己去思考怎么跟我们的工业应用场景相结合,这两方面,我们需要对技术本身很理解,我们也需要对我们的工业应用场景很理解。孙伟杰:感谢赵旭山老师的分享。刚才两位老师在聊电池这个领域的时候,其实不约而同的都聊到了电解液方面的进展是比较多的,请两位老师快速回答一下,是否相对于正极、负极这些领域,电解液它发展的还是比较快的?这里面可能的原因是什么?张强:电解液容易采用数据来计算,而且是匹配正负级材料最急迫的问题,所以我觉得从需求还是方法,现有的方法刚好满足这样的需求,我的体会。赵旭山:从我们角度来说,电解液是最难的,因为正负极不管晶体还是无定型我还能建一个模,电解液其实很难实现。孙伟杰:提到电解液,其实是一个小分子,和药物小分子其实很多方面的计算,也是比较相似,正好我们过渡到生物医药行业的看法。请教一下朱维良老师,因为您也是国内CADD计算化学先驱者,在您过去漫长研发经历里面,AI带来的相比于过去CADD的方法带来新东西是什么?AI方法给您的研究带来一些比较令人兴奋的成果,有没有方便分享的?朱维良:说到AI,最近3、5年时间,一个新名词叫"AIDD",其实大家都听说过,正如这一次会议材料里面讲的,AI是CADD一种新的强大的一种工具,所以说到它对我留下深刻的印象,我觉得首先就是AI在创新药物研究领域的应用,未来是前途;小到一个创新药物的公司,大到整个国家,要是您的新药研究不去拥抱和使用人工智能,那是绝对是没有前途的,可以这样讲。因为我感觉到这么多年来,相比较技术不断地迭代,迭代到现在的深度学习人工智能,是对创新药物研究,特别是在公司层面创新药物研究,是效率最高一次。就会使速度有数量级上的提升,同时它的准确度,也是革命性,或者变革性一个提高。 我可以说分三个层级来讲这个问题,就是要做创新药物,在早期研发大概围绕药物和靶标他们之间相互作用之间做的,可能我们搞新药的人都有一个概念,钥匙就是我们要找的药,然后锁就是治疗疾病的靶标,所以我们就希望找一把钥匙去开这个锁,达到治病的目的。但是真实世界里面不是这样的,所以我们搞生命科学的人都知道,这个锁不是我们通常意义上的锁,是由很多很多的弹簧构成了一个不断扭动、不断跳动的锁;这把钥匙也不是刚性的钥匙,是不断可以运动本身形状可以改变的钥匙,这样一个柔性变化的钥匙和一个不断变化运动的一把锁,你要把它找到,这个非常困难。所以在过去50年的用计算机辅助做药过程中,所做的体系有成功案例,还是蛮多的。但是这里的靶标蛋白大概现在看上去,占整个可以用来做药物研发,大概15%左右,这个刚才我看到会议材料里面也讲,还有85%的靶标蛋白为什么在历史上没有很好的开发出来,没有使用CADD手段很成功的去开发出来,原因就是这个太复杂了。 但是在过去几年我们不断地看到报道,包括我自己团队也做,如果用深度学习的办法,来做药物和靶标蛋白他们的相互作用,我们DTI(drug-target interaction),它这个准确率可以达到80%、90%,0.8、0.9,那么这是我原来根本没有想到的,只是做了一个我才知道,这个深度学习真的是非常强大。所以这个是从基础层次上说,药物与靶标柔性这种作用,原来很难做。深度学习我们也不知道,它到底为什么,但是未来我们可能做可以解释的这个深度学习的方法,这是第一个层次做药。第二个层次做药就是创新性,做这个分子必须是新的,否则你没有创新性,没有公司愿意去升拉专利,没有公司愿意自己向前开发。创新性分子从哪里来?我们以前最最简单的是通过片断组合,把一个分子分成两块、三块、甚至四块,每一块用不同类型的碎片,比如说10个、100个,1000个,这样就会得到10的两次方,甚至10的五次方,甚至更多的这个组合出来的新化合物,然后进行合成,实现序列筛选然后合成。但不管怎么说,没有跳出你指定的范围,可是如果用对抗生成的算法,就可以得到一些新的分子结构,是完全超出你原来的这个结构的。它就是有创新性。刚才几位院士也都谈到,包括鄂老师、汤超老师都谈到创新性。从我们做新药角度来说,创新性首先最最关键的核心要素,就是分子结构是新的,可以生成新的专利知识的这样一个东西,所以新一代人工智能确实可以产生一些我们人脑想不到(的东西),这块是第二个做药方面。 第三做药方面核心问题就是成药性。成药性简单来说药片从吃下去,到离开身体,这个过程里面我们要五个要素来衡量它,叫ADME/T,吸收、分布、代谢,还有毒性等,一个五个方面。这五个方面和生物体、人体相互作用,在过去的几十年研究当中,包括我们上海药物研究所,我们做的还是比较早的,大概做了20多年有关ADME/T 成药型预测,陈凯先院士团队、蒋华良院士团队包括我的团队,特别是他们两位院士的团队都花了大量时间,做了20年,和世界同行一样,这个问题没有很好解决。这个药吃下去到底能够吸收多少,在身体里面待多长时间,都没有很好的办法。最近两年我们看到这个希望,这个希望就是深度学习,它带给我们巨大、多维的黑箱一样数据的挖掘,感觉到是有希望。但是我觉得还是没有完全解决,但是我看到它的希望。所以说您刚才问就是说,人工智能对创新药物研究带来的冲击和希望,我觉得体现在创新药物研究三个基本的核心问题,药物靶标作用、新分子生成、成药性的预测。这三个方面都是已经可以产生影响,或者即将产生革命性的影响的。我觉得非常值得期盼。孙伟杰:感谢朱老师的分享。接下来针对马健总的问题,其实某种程度上,生物医药领域是AI for Science最先开始落地的场景,甚至说那阵还不叫AI for Life Science,叫AI制药,也诞生了一系列非常牛的成果。比如说像AlphaFold,当然也出现非常优秀的创业公司,比如说晶泰科技,从您视角分享一下,为什么在生物医药这个赛道AI for Science会有比较快的发展,从您的创业视角来看,像晶泰科技这样的先驱企业,有哪些方面做的比较好?马健:谢谢伟杰,今天这个会包括上一个部分都受到了很多启发,首先我们说AI for Science,其实是AI for Life Science确实在过去这几年是发展比较早和比较快的。我的感觉因为生命科学医药产业,基本上集齐了整个学科鄙视链,从基础的物理学、化学到生物学到医学,咱们读书的时候都有这种感觉。我们中国叫学好数理化,走遍天下都不怕,一般就是数学看不上物理的,物理觉得化学是半经验学科,化学觉得生物和死记硬背文科差不多。到了医学就是这个东西有点像玄学。 什么叫AI for Science?有一个很关键的词叫做维度灾难,这个概念在物理学当中很多年以来在还原论和建构论当中,就一直讨论这个问题,我知道了世界的基础原理,最基本的例子,物理是不是可以解释万事万物,应该七十年代凝聚态物理大师 PW Anderson 过一个小文章 More is Different 大而不同,就举了很多这样的对应例子,你要学好化学,现在来讲学化学肯定得懂一点基本的量子物理,现在得化学诺贝尔奖很多都学物理的。要学生物学的话,(比如)分子生物学你得懂点化学。 所以看每个学科都有前面更基础的理论部分,但是方法论其实不一样,所以AI for Science在生物医药领域,正是因为它涵盖了从最基础的原子、电子,像诸位老师提到第一步,我们靶标和蛋白质和小分子的相互作用,再到细胞,到器官,到动物,到人,研究对象的复杂度是经历了一个维度灾难的,所以我觉得它和我们其他工业产业不一样,一般来讲可能做到一个物质材料基础部分,比如说规模化生产就差不多了,但药不行,因为药的研究阶段一过,马上就要进入到人的研究阶段,就是开发阶段。而人的复杂度比我们已知任何机械类东西都要更复杂,而且还涉及到安全伦理问题。所以说我总结一下过去几年我认为AI for Science在药物研发领域,更准确的讲叫AI in pharmaceutical industry,在这个领域当中跟基础的计算模型、理论模型有关的部分,其实我觉得像包括像深势科技,包括伟杰、林峰,这么多年其实一直就相当于是我们从材料到生物研究,我们其实解决了很多这种像分子动力学,像这种强关联体系、多维体系的计算问题,我们已经有了非常大的进展。当面对life science的时候,其实它的后半程是很大的挑战,就是药物研发从以终为始的角度来讲,归根到底是要治病救人,归根到底是要治疗或者满足未满足的临床需求,那么挑战在于整个过程长达十年,从基础研究,走向临床走向产业化,要经历的不同阶段的目标是不一样的,是个多阶段、多目标优化问题,而最大挑战是在于我们不知道目标该怎么算出来。 最近一个典型例子,LK99,这个东西想证伪证实大概一个月时间就够了。但是药的话,PCC临床候选化合物,哪怕在动物身上证明安全,有初步的药效,但是最大问题是从动物再到人,这个关系是我们没有办法通过 engineer 的方式解释的,所以这里面有很多问题就是远期目标很难在短期现在被描述出来,这也是魅力所在。我认为在未来长远发展讲,AI for Science的一个主战场肯定是生命科学领域,而且一定会越来越大放异彩。 我刚刚讲这段的时候,也是想间接回答伟杰第二个问题,就是说我们这几年经历了什么。晶泰在最开始也有非常单纯想法,我们觉得可以把分子生成、分子对接各方面计算都做的很好,我们的算力、算量、算法开发投入很大,但是在整个产业业务推进过程当中,我也特别能够有越来越的机会和医药研发的不管是企业负责人还是研发的人在交流,跟各种包括化学、生物、医学领域的人打交道,我感觉大家用的语言都很不一样。其实在讨论问题之前一定要明白对方的动机是什么,因为有可能一开始两边动机不对,不一样,光讨论技术上可能很难去推进下来,那么我觉得敬畏这个行业。包括我们说IT叫互联网+,现在我们叫AI+,但是要知道每一个垂直行业有一个特点,就是一米宽、百米深,这里看起来很窄的东西,但其实向下会有非常厚的积累。这个过程我相信越来越多的和行业的追求和目标,达到更大的一个统一。那么晶泰和深势一直也有很好的联系,希望有更多一些技术和产品侧的合作,共同给药物研发提供更多更好的工具,在这个方面提高大家一些科研和药物开发效率。
孙伟杰:感谢马健总的分享,也想快速追问马健总和朱维良老师一个问题,因为刚才张强老师提到,化学分子相对来说是比较容易用计算机算的,我们可以看到在过去CADD发展里面,确实化学药物进展也是更快。但是我们反过来想,为什么AlphaFold很好的被AI得到很好解决方案,因为它的输入本身是一个文字,是一个序列,更容易被计算机表示,从二位在生物医药行业里面从业的insight来看,你们觉得未来这段时间里面,相对来说更看好AI加小分子的发展,还是更看好AI加大分子的发展?朱维良:因为我做化学药,大分子做的比较少,只是在这次抗击新冠的时候,作为抗原,找抗原,为药所做抗体做了一点。我觉得可能做大分子的这个成功率可能更高一些,因为这个问题比较简单,你只要把大分子和它们之间的作用,把它实际出来,基本上就可以了。小分子的问题太多了,小分子到身体里面就是各种各样的,行走于各个部门各个地方,然后产生各种各样的作用,太复杂,所以我个人感觉可能大分子可能(相对更快一些)。马健:我也比较支持朱老师这个一种观点和想法,那么当晶泰大分子、小分子我们两边都在做,我也经常和行业开玩笑,说为什么前些年做小分子的多,那是因为大家买不起做生物药的仪器和设备,创业公司上来搞个几千万设备投入搞不起,但是我们很多小分子化药从早期研究阶段来讲,起步门槛费用不会太高,当然这是一个玩笑。 我们回到比如说CADD、AIDD我也觉得这几年经历了什么发展呢,就是一开始做的AIDD,很多都特别就是像CADD,是一个对于计算模型很多一些升级改造,比如说我们知道CADD实际上从我们最基础的量子力学、分子动力学、密度泛函等等,这么自下而上构建基础模型,是重要一种思路。但是实际上真正要AIDD来看到的一个事情,能不能基于更多数据,去发现一些我们靠原来这种假设检验没有办法找到一些规律,因此我们觉得在大分子领域有天然数据的量,通量更高。我觉得具体到两个 modality 差异上讲,小分子的话,难在早期分子发现方面确实比较难,但其实我们知道抗体药它的 discovery 阶段其实相对简单、相对容易一点,它的难点在抗体工程、可开发性,所以大家面对阶段难度差异也是有的,所以我觉得其实回到这个问题再往上一步,我觉得生物医药本身都是在追求用更好的办法,来解决某一个疾病,所以看哪一个 modality 更好吧,在具体适应症上。AI for Science
赋能药物及电池领域的同与不同
孙伟杰:其实刚才马健总和朱维良老师讨论的时候,也聊到我们AI包括计算的手段在生物医药领域应用所面临困难,当然主要就是临床前药是给动物吃,临床上药是要给人吃的,人体和生命体有巨大复杂性。在材料领域或者电池领域,我们面临的困难,会和生物医药领域有哪些不同呢?我们又是如何尝试去用AI解决这些困难的?赵旭山:我可能回答不是一个技术问题,因为刚才上一个问题的时候,我最后提到我们做工业研究的人要了解AI,做AI的人也要了解我们的工业应用场景。其实我想提的一个难点就是现在业内经常在提的,领域知识工程的嵌入,在AI里面的嵌入。这是一个问题。我还回到我自己自身的经历来看,就是我到公司以后,我给我们曾老板讲的第一个报告就是AI有可能的潜在应用,我会用AI做什么事,我摆了一堆,我自己觉得我讲的挺好,然后曾老板提了一个很尖锐的问题,就是你讲这些东西,让我怎么相信你这个模型或者黑匣子本身是可靠的,是可信的。 因为当时在和曾老板汇报之前,我们下面讨论过这个问题。我们的一个想法是AI加物理,这是最开始最早的时候,我们还没认知AI for Science的时候,我们认知的雏形,换到现在来说就是领域知识模型的嵌入。 举个例子,刚才我们宣传片里面提到了负极表面SEI模。SEI模我们现在总提出,我们也看不清它,也没法建模,也研究不清楚它,其实这就是一个问题。如果说我们什么都不清楚的话,我们把AI的方法怎么嵌入进去?怎么做事?一个简单问题,它在表面发生了什么?它反应物是什么?反应产物是什么?它有哪些东西?它在这个反应过程中的反应路径是什么?整体化学反应网络又该怎么去构建?只有这些东西理清楚了,AI才有用武之地,才能知道它该深入到哪个环节去解决什么样问题。张强:我的看法,AI它是用高质量数据去锁定多维度的目标,在单一模型也就是赵总讲的知识嵌入还不清晰的话,多维在对另一个多维的时候能够避免维度灾难有效的途径,所以我的感受第一要有高质量的数据,第二个要有高质量的评价这些数据的方法,中间的黑箱以前是靠小模型,靠人类已知模型来去做的,现在的话是可以稍微复杂一点,稍微黑箱一点,但是我能把处理的能力大幅度提升,我觉得这是AI巨大的优势。孙伟杰:因为我们材料领域不像生物医药领域面临临床和生命体复杂性的问题,但是相应我们材料领域有我们自己的困难,比如说后面的一些器件、工艺尺度的这些问题,这些领域的问题我们在做材料研究的时候,是怎么样去预见和提前克服呢?张强:其实我理解做电池和做临床类似,性质好用不代表到电池中好用,就跟我们做临床一样,小分子各项指标都很好,到人体就带来别的反应,所以我理解这两个事其实是一致的。孙伟杰:本质上还是相似的,只不过研究的课题、对象不太一样。感谢张老师的分享。接下来一个问题还是想针对我们电池行业的一个问题。我们可以看到生物医药领域其实是分工越来越精细的产业链分工的方法,有大量的CRO,基本上我们能想象到任何一个环节的任务,都有成熟CRO体系去帮助大家做外包研发,所以一个biotech我们可能三四个核心科学家,剩下所有的任务都可以外包出去,我就可以把一家公司做上市了。第一个问题就是我们为什么电池领域没有出现,或者材料领域没有出现类似的CRO这样的公司组织,以后会不会朝着这样的产业形态去演进呢?可能我们先请有产业经验的赵老师来分享。赵旭山:我就先谈谈我的看法,为啥没有这个东西。因为电池其实高速发展也就是这几年,在前些年包括到现在大家对电动汽车的接受也需要一定的距离,在这种产业背景下,这样的一个历程必然是一个起始到飞速增长的阶段。 第二,这个问题其实我想深势已经给了我们很好的回答,各个环节怎么去分工,大家怎么去协作,这其实换句话来说就是一个生态打造的过程,我们科研的生态怎么打造,我们工业的生态怎么打造,怎么把不同研究环节的人给找到,给组织起来,给更好的为前沿研究服务也好,还是工业应用也好,这个恐怕需要我们共同的努力,我们共同的寻找一种合作方式,把我们创新研究的生态怎么打造好,把我们相对来说就更像是私有云类似的概念,这里边的工业生态又怎么打造好。张强:我个人感觉电池行业越来越像芯片,越来越靠这种高精度的制造和材料的极限来去体现它的性质,它和这种生命的有机体的活性,我觉得有一个本质的区别是我们材料的话还是一个物质能量信息集成的体系,那么生命体还会多一个信息带来的灵魂,所以这样的话对于前面这几个相对明确的体系的话,追求极限制造的话实际上是把它集成到一个板子上,由一个整体来布局,要比零散的拆分可能效率更高,这也是我感觉电池行业可能更接近半导体行当,和生命行当确实在属性上我觉得差那么一个生命体的这种活性这样的一个东西,所以我理解两个模式自然也会有,无论是做研究还是从实验的目标都是有挺大差异的。电池行业其实说白了就是存储能量、释放能量,它本质和芯片存储信息、释放信息是一回事儿的。孙伟杰:您觉得电池行业的发展产业演进的逻辑可能和芯片行业的演进逻辑会更相似。张强:从我个人感觉是更接近,包括去工厂去看也是越来越像芯片厂的感觉。孙伟杰:我了解到晶泰科技现在也是做CRO的业务,当然是基于先进AI和自动化的手段,马总关于这个问题有什么自己的看法吗?马健:生物医药的研究阶段到工艺放大到临床到开发,其实即使一个大的药企big pharma它往往也要很多的CRO来帮它做这个事情,这当然是从我们说成本各方面的角度来考虑。我觉得但它还没有出现像电子产业行业当中它可能在某一个部分有这种,我这个比方打的可能不太恰当,比如说我们看电脑看计算机这个行业它会有芯片公司,全世界就那么几家特别牛,特别大,英特尔、AMD、英伟达这种,药物研发里头大部分还是跟人头费相关,我认为它有点像是一个劳动力密集型。马健:对,它有点劳动力密集型,大家说我们也在做创新,是,但是这种创新是按照你常复实验累积时间、工作量作为一个基本单元的。当然它会有很多做出药,最终药物分子上市,IP怎么怎么样。但大家知道这都是大量尝试试出来的,其实它这个里头效率工具引发的革命还没那么强,所以大家去药厂如果参观和看,会发现它在信息化、在自动化、在各方面,尤其在研究阶段,可能确实好多年以来没有什么特别大的变化和进展,你可能会看一个大的药企里头信息化程度最高是生产的部分,就是工艺放大之后我们说发酵罐合成的那个,那个其实点像我们中小型化工的部分,这个里头反而它的数字化各方面还是比较高的。但是到了研究阶段就有点像科研单位我们说研究体系里头,我感觉是相对还松散一些。现在我觉得有一个新的机会和机遇,不管是对于新药的药物分子研发,包括对于我们的材料,对于电池、电解液,我们过去实验室研究因为它是非标的,因为这里头有大量的探索性人和实验的这种客观物质的互动在内,所以它很少有比较高自动化的部分接入进来,就像我们今年大家看到最火的主题马上从ChatGPT正在向人形机器人在过渡,其实实验室进入到新的柔性智能化、自动化这个过程,我觉得在未来的3、5年可能会越来越快,因为新的一些从我们3C行业和其他行业发展起来的自动化技术、机器人的技术和包括我们说在像大模型、GPT方面,包括我们的计算模拟方面,这个构成起来对于研发模式的一个新的革命是很有可能发生的。孙伟杰:那我们从刚才的这几个问题里面稍微换一换思路和问题。因为我们AI最基本的几大要素是数据、算法、算力,那我们从算法和数据的这个角度我们再来看一看我们AI for Science在产业界的落地。 提起算法,很多人就吐槽算得都不准,但是实际上很多时候我们好像也不需要算得那么准,就想请各位老师依次回答一下,我们大概对算法精度的把握是怎样的,算到什么程度,虽然说它可能不准,但对我们的研究,或者对我们的实际研发它就有用了,它就能用了,这个东西我们对它的精度的要求的度通常我们是怎么衡量的。 朱维良:谢谢。我还是要再回到上一个问题,就是AI去做什么药更好一点,我刚才回答可能是生物医药的成功率更高,大家不要误解,大家都去做生物医药。因为你只要看,比如说这一次的新冠全世界用于治疗新冠,不是预防,治疗新冠的药能有几个是生物医药、生物大分子,有几个是化药,在中国已经上市了3个化药治疗新冠,在路上还有几个我知道。所以我补充一下,不要误解大家都去做生物医药。 你刚才谈到说的多么准,我觉得就看你是什么样的项目,处于什么样的阶段,如果说是一个全新靶标的新药研究,我讲的化药,其实你首先第一步就是要找到一个有活性的先导化合物,实现从0到1,因为你一个新的靶标意味着没有活性化合物报道的,这个过程其实你不需要太高的准确度,你的平台如果能测100个分子的话,那你就有1%、10%的成功率就很好了,你可以找到活性筛选优化了。如果你的平台可以筛10万个化合物,你有万分之一的成功率,所以这是第一看你是一个什么样性质的项目,如果你是一个me too、me better,那就是很快,那这个时候的话你就要在一系列的化合物里面去找到更好、更强的。我觉得这个时候大概率需要相对的,我绝对不要说的很准,但是这些化合物之间相对来说哪个更好,我只要把它算准就相对的deta算出来就行了,这个我只要跟阳性已经报道的或者已经上市的药物去比较,我这个化合物比你上市的药物要好,活性要强,或者代谢的稳定性更好的话,我就可以向前推,所以这个是做me too、me better,你用AI做,用CADD来做就可以更快、效率更高,你作为一个企业你就有竞争力了。这个是对于me too、me better。 如果是对于靶标预测,我有化合物很好,看上去有特殊的生物学功能,比如说我随便讲一句,防止衰老,不知道靶标,不知道机制,你要找靶标,假如是要通过计算的手段一定要去说把这个化合物与靶标蛋白结合的全部算出来去找靶标,那你就要绝对这个做的很好,所以我觉得不能一概而论,总体来说你作为一个AI for drug discovery,如果是一个coordinator也好,或者一个project leader也好,你必须要知道在你这个课题里面是一个什么样的情景,然后你一定要知道如何去选择最合适的人工智能的方法来服务于这个项目,我觉得没有一个绝对的方法,只是说怎么好的方法适合于你你就用什么样的方法,大概这么样的一个理解,不知道对不对。孙伟杰:准与不准是相对的,每个人心中有测不准定律,有时间维度,有空间维度,这时候我在想是哪个维度,想的是趋势,想的是相对关系,想的是绝对值,是我们提供这样一个算法它觉得准不准,还是我们第三方来去做评价准与不准,准与不准是相对的一个概念,能不能解决我们的问题,所以我理解准与不准更重要是要回答它有没有启发我们更加精准的找到问题,如果问题找准了,那可能答案也就清晰了,如果问题找不准,那么答案自然是不准确的,所以我理解的话主要取决于我们对于想算的东西是什么,它准的维度在什么,我们如何把每个人心里测不准原理时间、空间、要素放进来,我想这个真是仁者见仁、智者见智,智者总能够在废弃的数据终找到令人启发的闪光点。赵旭山:其实这个问题我并不是太喜欢,我并不喜欢回答这样的问题。为什么呢?你首先你这个问题提出的前提就是从科学数据或者一些角度你要求它准确率达到90%多甚至达到接近100%,那只有这样的话才能达到工业的需求吗?你刚才问的一个问题就是说它准到什么程度,工业界我们能接受。 其实我可以这样说,工业界已经接受它了,并且已经在用,甚至包括现在还尚没有定论没有能发挥价值的大模型,工业界已经在布局,也都在用了。它准不准就像刚才张老师说的,它是一个相对的,比如说我们现在在建立一些构效关系的时候,是材料的基本信息、工艺信息,它在预测最终的产品性能或者材料性能的时候确实预测不准,有些时候它能达到百分之六七十都不错了,这时候我们还应该反向思考,它这时候不准,但是在这种情况下我该怎么去改,怎么去用,这就像我们用的符号学习的方法一样,我直接预测最终的目标值不准,那我能不能通过一些符号学习的方法去生成比较紧凑的,比较美观的,比较简洁的这样一个表达式,这个表达式可能只是一个新的特征或者新的描述符,它是一个中间过程,我达不到最终结果,但是我能达到一个最终的过程,我找到一个新东西,这个新东西可能又跟结果是能够关联的。我们在评价准不准的时候不是准就好用,不准就不能用,而是应该在这种前提下我们怎么去改进它,怎么去用好它。孙伟杰:某种程度上意识到算不准才是我们很多研究的开始。马健总在这个问题上有什么分享吗?马健:我觉得刚刚几位老师其实讲得很全面了,尤其是对本身你这个问题的一个看法,既然你这么问了我就聊这个事儿,这个事儿其实特别有场景感,我在公司有时候跟我们研发同事负责人聊,我说你这个R^2 是 0.6跟0.58有啥区别,相关性什么的,我6个点就能给你画出一条大象来,对吧?咱们经常讲那个笑话,就给你6个点可以拟合任何你想要的曲线。当然我们严肃的来说在那个场景下,大家是希望通过计算的准确度来为下一个自动的一个过程或者人判断的过程做决策的,那就看他能不能支持我要做决策所需要的要素,当然也要去看同样计算的对象要得到的数据在实验是否容易获取,所以大家喜欢算命,这些东西心诚则灵,好多年后才验证十年后你咋样,这种事儿我们都可以搞。 回归到具体场景下,那我当然会更关心,第一就是说你有没有选在一个真正对业务,对于我们的药物研发下一个阶段过程你这个指标是不是必须要达到某一个准确度的,有没有别的方法可以。因为不要局限在只要一个方法来解决一个问题,这是一个。 第二,我们当然如果就从方法开发的角度,我们也特别关注你们的这个模型,因为我们其实学物理,学数学天然的事情,每给你一个模型,我们所有模型都是近似模型,都不是一个严格解,它一开始就带着天然的边界在里头的,你要看你在这种场景下这个模型它是有边界的,本来就不应该在这里头去解释某一些点。 第三,我们这个模型的计算精度它是否有一个很好的ROI的提升空间,往往大家都知道那句话,就是60分到80分很容易,80-85就很难,很多时候我们在做我觉得好多年下来我们的这种计算理论模型都是在一个平台上涨涨落落、涨涨落落,大家在纠结一些具体相关性的系数,具体覆盖率的一些对比,但是陷到这个里头去做方法论开发了,跳出来开只是我们企业在药物研发过程中的一环,别的办法过去也可以,除非你说到了一些更加需要自动化的阶段,因为我需要连续运转,我们现在的话也是包括从最近几年我觉得知识的这种积累和这种文献知识的挖掘和新的这种实验数据产生能力的构建等等,会对我们下一步找更好的方法会是一个好的铺垫,可能今天时间有限没办法展开来讲,我们可以后面再有机会多多讨论一下。孙伟杰:算法聊完了,我们再聊聊数据。提起数据大家尤其是材料、药物我们的数据都很少,但是我们又必须得去解决我们的这些问题,在您自己研究的领域里面我们是怎么样一是用尽办法充分利用好现有的数据,第二是怎么样获取更多更好的数据,有哪些可以分享的?要不我们从赵旭山老师先开始?赵旭山:这个问题又是一个我不太好回答的问题,因为工业跟科研不一样,科研的数据质量不好你反过去重做个实验你补一个数据,反正你把能用于你研究这些数据补全就行了,工业它制造的数据就这样,反正你爱用不用,我就这些数据,所以说我们经常面临的困难在这种小数据或者说在数据质量很差没办法长链条追溯的情况下你怎么办,我还是举一个例子。比如我们现在在做一些电池失效分析的基底预测模型,如果说我从来料的时候本身的数据我能追溯到它生产过程中所有的测试数据我就不需要AI了,我整个基底模型全部贯穿以后我就能对电池整个的行为,整个未来的性能做预测了,但是其实这在工业界是个很现实的问题,有些产线上的工人他在上传他数据的时候,它就随手写一个数据,甚至有些在纸片上写个数据拍个照片传到系统上,更别说数据的各个链条之间的关联了,在这个时候你咋办?我们只能采用数据本身的特征,找不到原来的数据关联,你这个数据肯定隐含了前面这些数据的信息,那我只能用AI的方法来做相应的工作,这也是AI在工业界最大的价值所在。张强:数据我觉得会有很多,尤其现在网络越来越发达,关键是怎么清洗,怎么样能够把最高质量的数据能做判断。所以我理解比如说以文献发表我自己的感受还是要追踪咱这个领域内有良好声誉,有这种长期的影响力的人物的数据,要比高水平期刊的数据质量要来得更高,这是我工作的一个体会。马健:首先药物研发数据,不同阶段的数据类型很多,比如说有人尝试过,包括成药性阶段毒性数据,可能没有大家想象那么多,如果单纯从数据量上讲,药物发现阶段有很多工程学的条件瓶颈,比如说化学合成效率,当然合成化合物越快,当然越有利用假设检验探索的迭代。当然我们在这块的话,最早的时候深势也是这样,我们是基于这个很多高精度模拟数据,对于方法进行训练,到后面的话,我们也希望通过这种自动化化学和生物试验,我们晶泰自己做的这部分智能自动化实验室产生更多标准化数据,中间当然我们也从数据库也好,专利、文献也都做过这方面的收集挖掘。像刚才张强老师提到,很多的数据可重复性本身就不高,还得有专家解读,有个朋友跟我讲,说你看生物信息学,从做数据科学家眼里来看,(英)每一个数据都是数字,但是你说生物看,这个东西的数字肯定不可靠,那个数据是相对准确度会高的,因为数据代表背后含义不一样,所以我觉得这里面这个道路会挺漫长的,但是我觉得下一代数据生成,尤其工业领域肯定更多注重如何从实验室当中,去更多的高效获取数据,降低数据获取价格的门槛。孙伟杰:请朱维良老师也分享一下,对于这个问题的见解。朱维良:刚才三位讲的非常好,如果只有一个很小的数据,我特别赞同就是刚才张强老师讲的,找长期在这个领域里面做研究的,它的数据拿来去做。但是对人工智能所要求的大数据来讲,一个实验室出来的数据不足以去支撑深度学习,回到我们做药,马总做药假如说我们用PCC你完成临床前所有研究,为这个终点,一旦你确定PCC,剩下来就听天由命,没有办法撤回来,下面一二三期临床该花几个亿,就几个亿下去,到最后基本上是设备成功,这个没办法改变,也没有办法知道,所以我想以PCC为我们新药研发终点,我们可以把实验分成三种不同水平,第一个水平在蛋白质水平上,第二个水平在细胞水平上,第三个水平在动物水平上,蛋白水平上,我个人认为现在不管从数量上,质量上来说是最高,我们前两天刚刚发表文章来说,我们收集了将近就是100万数量级,100万个活性化合物及其应用的靶标,就是靶标测出来的,这个数据我个人认为是比较靠谱的,我们自己做实验我们测蛋白质和小分子作用。 那么它的数量级可能会有三个数量级的不同,同志们想,要是对数学家来说,实际上用SPR去做,同样仪器,同样蛋白质小分子,你做几次,一到两个数量级是很正常,所以从这个意义上数量从数学家、物理学家眼光来看,它可能是即使在蛋白水平很糟糕,但是有没有活性,这个基本上都能够测出来,有就是有,只是强度不一样,所以这块我想应该在做药水平上,应该基本上没有太大问题可以做,至少可以做分类模型,这也没有开发可能性。 第二个细胞模型,这个问题大了这个数据相对刚才数据来说也是蛮多,但是不同的实验室出来的结果,那就千差万别,是yes和no的差别,yes里面可能毫摩尔级,微摩尔级的差别,这个也是数量级,这个如何清洗是非常头疼的事情,这个只能说通过各种各样的处理,不管来的哪些实验室包括什么方法进行分离,第三在动物数据至少有很难重复,所以我觉得生物医药这个数据特别后面两个水平的数据,非常少。如何来做呢?这个事情是比较头疼,你说合作生物医药合作,比如说我和马总去要点数据,马总说我们还没上市,不会给你了,如果上市了以后,我还要做二代也不会给你,那么我自己去做,不可能,所以我觉得现在目前来说,正如刚才讲的,这个事要在国家层面上,统一部署,你只要拿到国家的钱,必须把数据放在数据库里面,这样经过几年累积,那么就有很多很多的“黄金”在里面,那挖掘的东西真的有意义和价值。孙伟杰:时间所限,我们可能最后一个比较快速的问题,这也是一个开脑洞或者叫出题的问题,因为我们是代表场景的使用方,我们给做算法、做基础设施、做AI的团队出一些问题。大家知道像Alpha Fold这样轰动性成果的出现,其实需要很多条件耦合在一起的,在您所在这个领域里面,有一个最关键问题如果被AI解决掉了,有潜力出现下一个Alpha Fold这样级别的突破,有没有什么脑洞可以开一开?我们从马总先开始。马健:我班门弄斧一下,我觉得在药物研发当中,如果我们真的能解决很多的转化医学方面的问题,我们对人体的机理方面,比如说未来能够有一个数字人,我们临床就好办,我们早期模型研究就好办。当然我觉得这是一个需要很长时间构建的地方。赵旭山:我完全同意马总的说法,因为第一次工业革命最后完成的标准是机器制造机器,我们人工智能这个时代,完成的标准会不会是人工智能制造人工智能,机器人科学家,刚才我和马总还在讨论这件事。张强:是不是能够在信息空间维度精准描述材料和描述能量,如果这个做到了,实际上和信息人的概念是一致的,也就是相当于它能够把我们物质的能量、系统蕴含的信息,通过这种信息内部的关联,去构筑事实上也存在了世界上不仅有物质和能量空间,还有信息的另外一个平行空间,如果这个空间有,我想每个人也都永生了。朱维良:我的理解和刚才几位老师也很相似,我感觉在做化学药物这个领域里面,AlphaFold这个图谱实际上我不认为它是创造性的突破,我认为是生产力的突破。因为基于序列蛋白质三维结构三个数据就开始做通用模件,或者从头的这个预测,AlphaFold2不管未来是几,我能想象是非常快,能够把你知道的所有序列的蛋白质,通过超大算力刷一下全部弄出来,实际上具体到某一个蛋白质,如果能够用到,或者你自己有比较强的同一模件研究经历,我相信你生产出来的结果比AlphaFold2不会差,甚至比它更好,因为你会根据蛋白质的特点会调节所有的方法,用这些方法可能AlphaFold没有用的,所以我觉得更多是生产力水平的提高效率的提高。 至于说从这个意义来说,在创新药物里面要是说,有什么方面首先可以突破,我觉得我们很多问题,看起来很小很老,但是到现在没有解决,比如说最简单,我们化合物溶解性对化合物靶标蛋白和细胞、动物水平的活性测试是至关重要的,如果这个化合物不能溶水溶剂的话,下面的测试基本上没办法开展。所以也许这个问题是非常适合于人工智能的办法,来把现在世界上任何数据库里面有的billion级别的化合物,通通的把它的溶解度预测出来,并且通过系统的训练把溶解度做的比较准,觉得做的比较准,至少一个数量级范围,不要太大,我个人认为目前方法的水平和算力都已经达到了,我建议这个是一个突破口。 但是从做药角度来说,我觉得最重要的突破口应该是两个,一个是体内药效,第二个毒性,因为做药就得安全有效,所以如果能把化合物在体内药效预测到八九不离十,以及它的毒性预测到八九不离十,我觉得就会对创新药物研究带来革命性的变化,未来做药就是靠计算机的算算就可以了。所以这是我觉得AI for drug discovery and development的梦想,我希望这个梦想在五年、十年或者二十年如果能够实现就更好了。孙伟杰:非常感谢朱老师,也非常感谢各位老师的讨论和分享,因为时间有限,我们可能也不得不结束圆桌讨论环节。其实生物医药行业正处在一个相对寒冷的寒冬期,当然我们电池行业最近市场上也是越来越卷起来了,我觉得正是寒冬期和市场竞争才是倒逼我们新技术、更好提升我们行业效率的机会,也期待AI for Science技术发展,能够赋能更多下游领域应用,也是期待我们在电池、在生物医药领域AI for Science落地的经验,能够被更多人思考,被更多人讨论,再次感谢各位老师,我们这个环节暂时结束。
2023 科学智能峰会开幕:学界与业界先锋畅谈 AI for Science 产业落地及开放生态建设
新华社:2023版《科学智能 (AI4S)全球发展观察与展望》发布
新华网:向着新一轮科学革命制高点攀登——2023全球科学智能峰会观察
电池设计自动化平台Piloteye在2023科学智能峰会发布
2023科学智能峰会精彩回顾一|鄂维南院士引导发言:共建AI for Science
2023科学智能峰会精彩回顾二|巅峰对话:汤超、鄂维南、王坚、黄铁军激辩“大模型与AI for Science”
深势科技是“AI for Science”科学研究范式的引领者和践行者,致力于运用人工智能和多尺度的模拟仿真算法,结合先进计算手段求解重要科学问题,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。
我们开创性地提出了「多尺度建模+机器学习+高性能计算」的革命性科学研究新范式,并推出了Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台、RiDYMO®强化动力学平台及 Piloteye™ 电池仿真研发平台等微尺度工业设计基础设施,颠覆了现有研发模式,打造“计算引导实验、实验优化设计”的全新范式。
深势科技是国家高新技术企业、国家专精特新“小巨人”企业,总部位于北京,并在上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中公司的博士及博士后占比超过35%。核心成员获得过2020年全球计算机高性能计算领域的最高奖项“戈登贝尔奖”,相关工作当选2020年中国十大科技进展和全球AI领域十大技术突破。